智能论文笔记

On the Optimal Combination of Cross-Entropy and Soft Dice Losses for Lesion Segmentation with Out-of-Distribution Robustness

Adrian Galdran , Gustavo Carneiro , Miguel Ángel González Ballester

分类：计算机视觉

2022-09-13

我们研究不同损失功能对医学图像病变细分的影响。尽管在处理自然图像时，跨凝结（CE）损失是最受欢迎的选择，但对于生物医学图像分割，由于其处理不平衡的情况，软骰子损失通常是首选的。另一方面，这两个功能的组合也已成功地应用于此类任务中。一个较少研究的问题是在存在分布（OOD）数据的情况下所有这些损失的概括能力。这是指在测试时间出现的样本，这些样本是从与训练图像不同的分布中得出的。在我们的情况下，我们将模型训练在始终包含病变的图像上，但是在测试时间我们也有无病变样品。我们通过全面的实验对内窥镜图像和糖尿病脚图像的溃疡分割进行了全面的实验，分析了不同损失函数对分布性能的最小化对分布性能的影响。我们的发现令人惊讶：在处理OOD数据时，CE-DICE损失组合在分割分配图像中表现出色，这使我们建议通过这种问题采用CE损失，因为它的稳健性和能够概括为OOD样品。可以在\ url {https://github.com/agaldran/lesion_losses_ood}找到与我们实验相关的代码。

translated by 谷歌翻译

Test Time Transform Prediction for Open Set Histopathological Image Recognition

Adrian Galdran. Katherine J. Hewitt , Narmin L. Ghaffari , Jakob N. Kather , Gustavo Carneiro , Miguel A. González Ballester

分类：计算机视觉

2022-06-20

整个幻灯片组织学图像中的组织类型学注释是一项复杂而乏味但既繁琐但必要的任务，用于开发计算病理学模型。我们建议通过将开放式识别技术应用于共同分类属于一组带注释类的组织的任务来解决此问题。临床相关的组织类别，同时拒绝测试时间开放式样品，即属于训练集中不存在的类别的图像。为此，我们引入了一种基于训练模型的开放式组织病理图像识别的新方法，以准确识别图像类别，并同时预测已应用了哪些数据增强变换。在测试时间中，我们测量了模型的置信度预测这种转换，我们期望开放集中的图像较低。在组织学图像的结直肠癌评估的背景下，我们进行了全面的实验，这些实验为我们的方法提供了证据，以自动从未知类别中识别样品的优势。代码在https://github.com/agaldran/t3po上发布。

translated by 谷歌翻译

Convolutional Nets Versus Vision Transformers for Diabetic Foot Ulcer Classification

Adrian Galdran , Gustavo Carneiro , Miguel A. González Ballester

分类：计算机视觉

2021-11-12

本文将良好的卷积神经网络（CNNS）与最近引入了糖尿病脚溃疡分类任务的最近引入的视觉变压器，在DFUC 2021的宏伟挑战的背景下，这项工作达到了第一位置。综合实验表明，现代CNNS仍然能够在低数据制度中表现出变压器，这可能是它们更好地利用空间相关性的能力。此外，我们经验证明最近的清晰度感知最小化（SAM）优化算法显着提高了两种模型的泛化能力。我们的结果表明，对于此任务，CNN和SAM优化过程的组合导致优于任何其他考虑方法的性能。

translated by 谷歌翻译

Curriculum learning for improved femur fracture classification: scheduling data with prior knowledge and uncertainty

Amelia Jiménez-Sánchez , Diana Mateus , Sonja Kirchhoff , Chlodwig Kirchhoff , Peter Biberthaler , Nassir Navab , Miguel A. González Ballester , Gemma Piella

分类：计算机视觉

2020-07-31

来自X射线图像的近端股骨骨折的足够分类对于治疗选择和患者的临床结果至关重要。我们依赖于常用的AO系统，该系统描述了将图像分类为类型和亚型的分层知识树根据裂缝的位置和复杂性。在本文中，我们提出了一种基于卷积神经网络（CNN）自动分类近端股骨骨折的近端骨折分类为3和7 AO类。如已知所知，CNNS需要具有可靠标签的大型和代表性数据集，这很难收集手头的应用。在本文中，我们设计了一个课程学习（CL）方法，在这种情况下通过基本的CNNS性能提高。我们的小说配方团结了三个课程策略：单独加权培训样本，重新排序培训集，以及数据采样子集。这些策略的核心是评分函数排名训练样本。我们定义了两种小说评分函数：一个来自域的特定于域的先前知识和原始的自我节奏的不确定性分数。我们对近端股骨射线照片的临床数据集进行实验。课程改善了近端股骨骨折分类，达到了经验丰富的创伤外科医生的性能。最佳课程方法根据现有知识重新排列培训集，从而达到15％的分类提高。使用公开可用的MNIST DataSet，我们进一步讨论并展示了我们统一的CL配方对三个受控和具有挑战性的数字识别方案的好处：具有有限的数据，在类别 - 不平衡下以及在标签噪声存在下。我们的工作代码可在：https://github.com/ameliajimenez/curriculum-learning-prior -unctainty。

translated by 谷歌翻译

A Snapshot of the Frontiers of Client Selection in Federated Learning

Gergely Dániel Németh , Miguel Ángel Lozano , Novi Quadrianto , Nuria Oliver

分类：人工智能 | 机器学习

2022-09-27

Federated learning (FL) has been proposed as a privacy-preserving approach in distributed machine learning. A federated learning architecture consists of a central server and a number of clients that have access to private, potentially sensitive data. Clients are able to keep their data in their local machines and only share their locally trained model's parameters with a central server that manages the collaborative learning process. FL has delivered promising results in real-life scenarios, such as healthcare, energy, and finance. However, when the number of participating clients is large, the overhead of managing the clients slows down the learning. Thus, client selection has been introduced as a strategy to limit the number of communicating parties at every step of the process. Since the early na\"{i}ve random selection of clients, several client selection methods have been proposed in the literature. Unfortunately, given that this is an emergent field, there is a lack of a taxonomy of client selection methods, making it hard to compare approaches. In this paper, we propose a taxonomy of client selection in Federated Learning that enables us to shed light on current progress in the field and identify potential areas of future research in this promising area of machine learning.

translated by 谷歌翻译

Known by the company we keep: `Triadic influence' as a proxy for compatibility in social relationships

Miguel Ruíz-García , Juan Ozaita , María Pereda , Antonio Alfonso , Pablo Brañas-Garza. Jose A. Cuesta , Ángel Sánchez

分类： (统计)机器学习

2022-09-08

社会互动网络是建立文明的基材。通常，我们与我们喜欢的人建立新的纽带，或者认为通过第三方的干预，我们的关系损害了。尽管它们的重要性和这些过程对我们的生活产生的巨大影响，但对它们的定量科学理解仍处于起步阶段，这主要是由于很难收集大量的社交网络数据集，包括个人属性。在这项工作中，我们对13所学校的真实社交网络进行了彻底的研究，其中3,000多名学生和60,000名宣布正面关系和负面关系，包括对所有学生的个人特征的测试。我们引入了一个度量标准 - “三合会影响”，该指标衡量了最近的邻居在其接触关系中的影响。我们使用神经网络来预测关系，并根据他们的个人属性或三合会的影响来提取两个学生是朋友或敌人的可能性。或者，我们可以使用网络结构的高维嵌入来预测关系。值得注意的是，三合会影响（一个简单的一维度量）在预测两个学生之间的关系方面达到了最高的准确性。我们假设从神经网络中提取的概率 - 三合会影响的功能和学生的个性 - 控制真实社交网络的演变，为这些系统的定量研究开辟了新的途径。

translated by 谷歌翻译

Deep Semi-Supervised and Self-Supervised Learning for Diabetic Retinopathy Detection

Jose Miguel Arrieta Ramos , Oscar Perdómo , Fabio A. González

分类：计算机视觉

2022-08-04

糖尿病性视网膜病变（DR）是发达国家工人衰老人群中失明的主要原因之一，这是由于糖尿病的副作用降低了视网膜的血液供应。深度神经网络已被广泛用于自动化系统中，以在眼底图像上进行DR分类。但是，这些模型需要大量带注释的图像。在医疗领域，专家的注释昂贵，乏味且耗时。结果，提供了有限数量的注释图像。本文提出了一种半监督的方法，该方法利用未标记的图像和标记的图像来训练一种检测糖尿病性视网膜病的模型。提出的方法通过自我监督的学习使用无监督的预告片，然后使用一小部分标记的图像和知识蒸馏来监督微调，以提高分类任务的性能。在Eyepacs测试和Messidor-2数据集中评估了此方法，仅使用2％的Eyepacs列车标记图像，分别使用0.94和0.89 AUC。

translated by 谷歌翻译

Robust Self-Tuning Data Association for Geo-Referencing Using Lane Markings

Miguel Ángel Muñoz-Bañón , Jan-Hendrik Pauls , Haohao Hu , Christoph Stiller , Francisco A. Candelas , Fernando Torres

分类：机器人 | 计算机视觉

2022-07-28

基于航空图像的地图中的本地化提供了许多优势，例如全球一致性，地理参考地图以及可公开访问数据的可用性。但是，从空中图像和板载传感器中可以观察到的地标是有限的。这导致数据关联期间的歧义或混叠。本文以高度信息的代表制（允许有效的数据关联）为基础，为解决这些歧义提供了完整的管道。它的核心是强大的自我调整数据关联，它根据测量的熵调整搜索区域。此外，为了平滑最终结果，我们将相关数据的信息矩阵调整为数据关联过程产生的相对变换的函数。我们评估了来自德国卡尔斯鲁厄市周围城市和农村场景的真实数据的方法。我们将最新的异常缓解方法与我们的自我调整方法进行了比较，这表明了相当大的改进，尤其是对于外部城市场景。

translated by 谷歌翻译

Vehicle Trajectory Prediction on Highways Using Bird Eye View Representations and Deep Learning

Rubén Izquierdo , Álvaro Quintanar , David Fernández Llorca , Iván García Daza , Noelia Hernández , Ignacio Parra , Miguel Ángel Sotelo

分类：计算机视觉 | 人工智能

2022-07-04

这项工作提出了一种新的方法，可以使用有效的鸟类视图表示和卷积神经网络在高速公路场景中预测车辆轨迹。使用基本的视觉表示，很容易将车辆位置，运动历史，道路配置和车辆相互作用轻松包含在预测模型中。 U-NET模型已被选为预测内核，以使用图像到图像回归方法生成场景的未来视觉表示。已经实施了一种方法来从生成的图形表示中提取车辆位置以实现子像素分辨率。该方法已通过预防数据集（一个板载传感器数据集）进行了培训和评估。已经评估了不同的网络配置和场景表示。这项研究发现，使用线性终端层和车辆的高斯表示，具有6个深度水平的U-NET是最佳性能配置。发现使用车道标记不会改善预测性能。平均预测误差为0.47和0.38米，对于纵向和横向坐标的最终预测误差分别为0.76和0.53米，预测轨迹长度为2.0秒。与基线方法相比，预测误差低至50％。

translated by 谷歌翻译

Insertion of real agents behaviors in CARLA autonomous driving simulator

Sergio Martín Serrano , David Fernández Llorca , Iván García Daza , Miguel Ángel Sotelo

分类：机器人

2022-06-01

由于需要快速原型制作和广泛的测试，模拟在自主驾驶中的作用变得越来越重要。基于物理的模拟使用涉及多个利益和优势，以合理的成本消除了对原型，驱动因素和脆弱道路使用者的风险。但是，有两个主要局限性。首先，众所周知的现实差距是指现实与模拟之间的差异，这阻止了模拟自主驾驶体验实现有效的现实性能。其次，缺乏有关真实代理商的行为的经验知识，包括备用驾驶员或乘客以及其他道路使用者，例如车辆，行人或骑自行车的人。代理仿真通常是根据实际数据进行确定性，随机概率或生成的预编程的，但它不代表与特定模拟方案相互作用的真实试剂的行为。在本文中，我们提出了一个初步框架，以实现真实试剂与模拟环境（包括自动驾驶汽车）之间的实时互动，并从多个视图中从模拟传感器数据中生成合成序列，这些视图可用于培训依赖行为模型的预测系统。我们的方法将沉浸式的虚拟现实和人类运动捕获系统与Carla模拟器进行自主驾驶。我们描述了提出的硬件和软件体系结构，并讨论所谓的行为差距或存在。我们提出了支持这种方法的潜力并讨论未来步骤的初步但有希望的结果。

translated by 谷歌翻译